通义听悟:阿里云推出的 AI 音视频转录工具
关注 “AI 工具派”
探索最新 AI 工具,发现 AI 带来的无限可能性!
「近期热门」
今天 Chris 给大家推荐的工具是「通义听悟」,一款阿里云推出的 AI 音视频转录工具,快来一起看看吧。
工具地址:https://tingwu.aliyun.com/
Chris 往期“通义大模型”系列文章回顾:
一、工具介绍 🛠️
通义听悟是一款阿里云推出的 「AI 音视频转录工具」,「聚焦于音视频内容的工作学习 AI 助手」,依托通义千问语言模型、音视频 AI 模型能力,帮助用户记录、整理和分析音视频内容,用大模型做音视频笔记、整理会议记录。
目前主要面向以下四类场景:
「企业办公」:OA、IM、CRM等各类办公系统中集成通义听悟,为企业提高会议、面试、访谈、培训、客户交流等场景的信息提取效率。交流内容可回溯、交流重点可查询、相关内容快速定位。 「在线教育」:可将在线课程进行知识点总结、授课主题划分、添加课程字幕。尤其在录播课场景,快速定位回看,一学期的知识点可快速检索定位。二次挖掘授课视频的价值,提高复习的针对性。 「网盘及媒资库」:对存储的音视频内容进行转写、翻译,并提炼核心内容与章节定位,“阅读”音视频文件,提高信息转化效率。 「金融与媒体」:访谈、演讲、路演等交流内容的转写与总结。
二、快速上手 🚀
接下来 Chris 和大家一起体验一下视频转录功能:
1.上传音视频
在主页点击“上传音视频”,然后选择“上传本地音视频文件”:
2.设置音视频配置
这里需要设置:
「音视频语言」:即当前音视频内容的语言; 「翻译」:即打算翻译成什么语言;
然后就可以点击“开始转写”。
3.转写成功,查看详情
接着需要等待转写,转写效率跟视频时长有关系。
等待转写成功后,即可从左侧“我的记录”菜单进入,查看刚才转录的结果:
4.查看转录结果
为了方便查看转录结果,Chris 将视频收起,可以看到智能生成以下内容:
「关键词」:音视频中的关键词; 「全文概要」:音视频内容的概要; 「章节速览」:音视频内容中的主要内容,按照章节划分,并显示时间轴; 「发言总结」:可以对音视频内容进行智能发言总结; 「提取PPT」:将音视频内容中的 PPT 截图提取出来展示,并显示时间轴; 「原文」:按照时间轴进行音视频内容转文本的展示,并支持显示翻译结果;
整体效果还是挺不错的。
三、核心功能 🔍
接下来 Chris 总结一下通义听悟的几个核心功能:
1.音视频转写
通义听悟将音视频内容转写成文本,默认是原文和译文,并且在视频播放过程中,会「自动定位」到当前音视频进度所对应的文本位置,方便查看:
2.音视频概要和总结
通义听悟将音视频转录完成后,会生成该音视频内容的「全文摘要」和「章节速览」等内容,更能提高学习效率:
3.记录笔记
通义听悟提供了一个非常不错的编辑器,用来让用户边看视频边记录笔记,非常好用:
并且还可以通过“批量摘取”功能,将转录结果中的内容,快速插入到笔记当中:
4.导出总结
通义听悟支持将当前所有转录内容导出,导出配置包括:
文件内容:英文、中文和双语对照; 文件格式:doc/pdf/srt; PPT 音视频
还可以「选择导出到本地还是阿里云盘」。
5.支持多端使用
通义听悟目前支持 Chrome、Edge 浏览器插件,钉钉、微信小程序的使用,非常方便,随时随地可以记录:
6.实时记录和博客链接转写
这两个功能也很常用,大家可以自行体验看看:
「开启实时记录」:实时语音转文字,同步翻译,智能总结要点,可以用在「在线会议的场景」; 「播客链接转写」:输入 RSS 订阅链接,无需下载,智能提炼总结,非常方便。
四、收费情况 💰
目前通义听悟还在限时免费体验中,大家可以通过通义听悟的“权益加油站”的活动,「免费获取转写时长」,目前有以下方式:
「每日登录」,自动签到获取 「10 小时」转写时长; 「邀请好友」或「分享记录给好友」,好友通过链接注册并登录通义听悟,邀请者即可获取 「30 小时」转写时长; 首次获取「阿里云盘授权」,自动获取 「50 小时」转写时长。
五、总结 📝
通义听悟是阿里云推出的 AI 音视频转录工具,具有音视频转写、生成概要和总结、记录笔记、导出文档等功能,可以高效地提炼和记录音视频中的关键信息。目前限时免费体验中。
Chris 觉得,通义听悟是一个非常实用的工具,可以极大地提高工作学习效率,推荐大家尽快去体验。
这里是“「AI工具派」”,探索最新AI工具,发现AI带来的无限可能性。我们下一期见。
扫码加群/商务合作
探索 AI 无限可能